Cos'è frequency serie?
Serie di Frequenza
Una serie di frequenza è una rappresentazione tabellare dei dati che mostra la frequenza (cioè il numero di volte) con cui ogni valore o intervallo di valori si verifica in un dataset. È uno strumento fondamentale nella statistica descrittiva per riassumere e visualizzare la distribuzione dei dati.
Ecco alcuni aspetti importanti:
-
Definizione: Una serie di frequenza associa ogni valore o intervallo di valori di una variabile con la sua frequenza corrispondente. (https://it.wikiwhat.page/kavramlar/Frequenza)
-
Tipi di Serie di Frequenza:
- Serie di frequenza semplice: Elenca ogni valore distinto della variabile e la sua frequenza. È adatta per dati discreti o quando il numero di valori distinti è relativamente piccolo.
- Serie di frequenza raggruppata (o per classi): I dati vengono raggruppati in intervalli di classe (o classi). Ogni classe ha un limite inferiore e un limite superiore, e la frequenza indica il numero di osservazioni che rientrano in quell'intervallo. (https://it.wikiwhat.page/kavramlar/Intervallo%20di%20Classe)
-
Termini importanti:
- Frequenza assoluta: Il numero di volte che un valore o una classe si verifica.
- Frequenza relativa: La proporzione della frequenza assoluta rispetto al numero totale di osservazioni. (Frequenza assoluta / Numero totale di osservazioni). (https://it.wikiwhat.page/kavramlar/Frequenza%20Relativa)
- Frequenza percentuale: La frequenza relativa espressa come percentuale. (Frequenza relativa * 100).
- Frequenza cumulativa: La somma delle frequenze di tutte le classi fino a quella corrente. Utile per calcolare percentili e altri quantili. (https://it.wikiwhat.page/kavramlar/Frequenza%20Cumulativa)
-
Costruzione di una Serie di Frequenza Raggruppata:
- Determinare il numero di classi: Non esiste una regola fissa, ma generalmente tra 5 e 20 classi sono sufficienti. La regola di Sturges (1 + 3.322 * log10(n), dove n è la dimensione del campione) è un'euristica comune.
- Calcolare l'ampiezza della classe: Approssimativamente (Valore massimo - Valore minimo) / Numero di classi. L'ampiezza della classe dovrebbe essere uniforme, se possibile. (https://it.wikiwhat.page/kavramlar/Ampiezza%20della%20Classe)
- Definire i limiti di classe: Assicurarsi che le classi siano mutuamente esclusive (un valore non può appartenere a due classi diverse).
- Contare le frequenze: Contare quante osservazioni rientrano in ogni classe.
-
Vantaggi:
- Riepiloga grandi dataset.
- Facilita la visualizzazione della distribuzione dei dati.
- Semplifica il calcolo di statistiche descrittive.
-
Svantaggi:
- La serie di frequenza raggruppata comporta una perdita di informazioni, in quanto non si conoscono i valori esatti all'interno di ogni classe.
- La scelta del numero di classi e dell'ampiezza della classe può influenzare la forma della distribuzione risultante.
Le serie di frequenza sono spesso utilizzate come base per la creazione di istogrammi e poligoni di frequenza, che sono rappresentazioni grafiche della distribuzione dei dati. (https://it.wikiwhat.page/kavramlar/Istogramma) e (https://it.wikiwhat.page/kavramlar/Poligono%20di%20Frequenza)